2013/09/29

[摘譯] 麥肯錫 2013 Q3 全球經濟剪影

原文
Economic Conditions Snapshot, September 2013: McKinsey Global Survey results

摘要

  • 全球經理人對景氣持續樂觀
  • 成長焦點由新興市場移往已開發國家
  • 不確定性逐漸消除,對歐元區的成長最樂觀
  • 新興市場的三大風險:失業率、通膨、匯率
  • 消費需求疲弱為全球最大風險,區域衝突與政治不穩的疑慮逐漸淡化


[摘譯] 利用靈活物件產生原創解答:flexons

原文出處:McKinsey Five routes to more innovative problem solving

開放式創新」(Open Innovation)結合了「開放」、「社群」、「群眾外包」等等新潮的概念,儼然成為創新方法典範,之前在談 Innocentive 的文章裡也簡單的介紹過。這篇麥肯錫季刊的文章,利用 flexons 這個新詞(產生新解決方案的彈性物件,flexible objects for generating novel solutions,暫且翻成「彈性子」好了),介紹了開放式創新在執行面上的一些分析和建議。

文中定義了五種 flexon,分別是:
  • 網絡(Network flexon):將複雜的問題分解成若干元素,然後依據元素之間的關聯性,將整個問題以網絡的方式呈現,可以讓我們更容易優化決策流程。這個網絡可以是採購主的人際關係、交通系統的節點,或是其他複雜的問題。
  • 演化(Evolutionary flexon)演化算法evolutionary computation)已經在很多複雜的優化問題上被證實是非常有效率的方式。我們常常需要在有限的資源下,做不同策略的嘗試,演化算法的概念可以幫助我們更快、更有效率的進行這樣的活動。(以前介紹過演化算法,所以不多寫了)
  • 決策代理(Decision-agent flexon):博奕理論(Game Theory)假設人的社會行為是每個人在互動中追求自己最大利益的結果。而「決策代理」基本上就是把這樣的邏輯應用在創新策略上,分析各個競爭與合作對象之間的互動,找出平衡下的適當決策。當然,我們不必假設每個人都是理性的在「最大化自己的利益」,也可以再加入慾望、情緒等左右決策的因素,讓這個「代理人」的決策行為更能代表議題所牽涉的利害關係人。
  • 系統動力(System-dynamic flexon):分析一個商業決策,在整個複雜商業環境中,會激發出什麼深遠的影響,一向都是很大的挑戰。如果把商業環境看成一個系統,把資金、原物料、產品、資訊類比作能量、熱、電磁波、電流,則可以由這些元素的流動過程分析彼此之間的因果關係。
  • 資訊處理(Information-processing flexon):把商業環境當作資訊處理架構來分析,可以看出哪些環節造成最大的成本、哪些資訊被反覆的利用,讓我們可以快速的找到直接影響決策效率的焦點。
[譯按]
作者介紹的五種 flexon,其實是借用五種不同領域分析問題的架構,來看待商業問題,原文中並舉了兩個例子(創新重組跟預測未來),解釋在實際情境中如何使用 flexon。


2013/09/27

[Data Analytics] 資料科學家們的各種樣貌

[原文] There's More Than One Kind of Data Scientist

[譯按]
這篇文章是介紹 O'Reilly Media 的免費小書:分析者的分析:關於資料科學家與他們的工作的內省(Analyzing the Analyzers: An Introspective Survey of Data Scientists and their Work)。本來想等沒什麼人在談 Big Data 再來翻這篇的,不過可能最近聽巨資料聽到有點麻痺了,加上這本書講的是「反省」,所以還是簡單介紹一下好了。

[摘譯]
這是一本「用資料科學來研究資料科學家」的書。我跟另外兩位作者,這些年來組織了相當多關於統計與分析專業人士的聚會,在過程中認識了很多人,這些人有著截然不同的教育背景、工作經驗、性向和態度,可是為什麼這些人都稱自己是「資料科學家」呢?

我們相信,這是因為很多人對於現有的職業分類裡,關於他們所扮演的角色、所做的工作內容,都沒辦法有另他們滿意的描述或稱謂,所以才有了「資料科學家」這個新的職稱、新的職涯。

我們在2012年初,發覺了這個嶄新的職業類別,也就很自然的用資料科學的方式,對這些人做了分析。我們發現,這群逐漸成形的「資料科學家」們大致上可以分成幾個類別:

  • 資料商業家(Data Businesspeople)是一群產品、獲利導向的資料科學家。他們是有技術背景的領袖、經理人、創業家,學歷通常是理工背景加上 MBA。
  • 資料創意家(Data Creatives)是電子萬事通,有能力處理形形色色的資料,使用各式各樣的工具。他們可能認為自己是藝術家或駭客,對於視覺化和各種開源軟體都很有一套。
  • 資料開發者(Data Developer)專注於開發實際在線上運作的軟體,用於處理統計、分析、或機器學習的問題。這些人通常都有電腦科學的學位,並且從事與「巨資料」有關的工作。
  • 資料研究員(Data Researcher)有較深的學術背景,受過科學訓練,並且將他們所會的工具和技術應用在組織的資料上。他們通常有博士學位,而他們用數學工具發揮的創意運用,通常可以帶來珍貴的洞見或產品。

如果把資料科學的知識領域分成五種:商業、機器學習/巨資料、數學/作業研究、程式設計,和統計,上述的四種資料科學家在這五大知識領域的熟悉度可以用下圖表示:

更多的內容,請見全文




2013/09/11

[Data Analytics] 巨資料的市場有多大?沒人知道

原文:Sizing The Big Data Market: No One Has A Clue – ReadWrite

[摘譯]
讓我們忘了那些關於巨資料(Big Data)的數據吧。真正的事實,是沒有人知道巨資料的商業市場表現,因為很少人真的知道到底什麼是巨資料。

Gartner 的副總 Ian Bertram 指出,50%的企業認為他們在巨資料議題上所遭遇的問題在於異質資料的統整 (variety),而非大量的資料 (volume) ([譯按] 巨資料有所謂的 3V:「多樣性」 variety,「大量」 volume,以及「速度」 velocity。),所以「巨」顯然不是個真議題。

Marketo 的 Jon Miller 說:「所謂的『巨資料』,是一個概略性的詞彙,意指一種極度大量、極度複雜的資料,超出了 1980 年代以來關聯式資料庫所能處理的範圍,所以亟需新的處理方式。」既然是一個「概略性的詞彙」,那我們怎麼能界定一個新的應用是不是屬於「巨資料」的範疇?

所以 Wikibon 嘗試估算巨資料產業的規模,我們就權且辜妄聽之吧。

我在想,會不會我們在說「巨資料」的時候,說的其實只是「資料」?我們所謂的「巨」並沒有實質的意義,只是我們可以把「比以前更多」的資料拿來發揮作用而已。

Ian Bertram 應該跟我所見略同,他說:
我很想問,為什麼要叫做「巨資料」?它到底「巨」在哪裡?為什麼不乾脆叫做「資料」或「資訊」?反正我們說的僅僅是從不同的資料來源抽取數據然後統整在一起,或許加上尋找特定型態,建立模型,指出風險,理解人的意圖與情感,建立網絡,這些事情而已。
換句話說,我們做的事情跟從前毫無差別:「讓資料發揮作用」,差別只是把工具換成 Hadoop 和 NoSQL,讓我們可以更有效率的做更多事情。

[譯按]
我喜歡這篇文章的副標題:
Big Data is a meaningless term that attempts to describe what we've spent years doing: putting data to work.
「巨資料只是一個無意義的字眼,試圖描述我們過去一直在做的事情:『讓資料發揮作用』」

前陣子在朋友轉貼的 Big Data 相關文章上回應:「Big Data 到現在已經成了行銷字眼,跟它起鬨你就紅了,跟它認真你就輸了」,大概也是差不多的意思。君不見我這兒正是在跟著Big Data 起鬨嗎?XD